推理科幻影视_第6页

卡塔尔研究院开发ADAM：首个专门评估AI传记推理能力的综合框架

这项由卡塔尔计算研究院的Ehsaneddin Asgari教授领导、联合普林斯顿大学、弗吉尼亚理工和印度阿米提大学共同完成的开创性研究，于2025年9月发表在arXiv预印本平台（编号：arXiv:2509.22991v1）。有兴趣深入了解的读者可以通过该编号

卡塔尔推理开发 adam 研究院 2025-10-27 22:31 8

「不仅会想，还能准确去做」VLA-R1把「推理+行动」带进真实世界

在机器人与智能体领域，一个老大难问题是：当你让机器人 “把黄碗放进白色空篮子” 或 “从微波炉里把牛奶取出来放到餐桌上” 时，它不仅要看懂环境，更要解释指令、规划路径 / 可操作区域，并把这些推理落实为准确的动作。目前，很多 VLA（Vision-Langua

推理真实世界 rl cot iou 2025-10-27 19:11 7

垃圾数据侵蚀AI大脑！大模型新研究：Llama推理能力大降，自恋水平翻倍

10月15日，德国农工大学、德克萨斯大学奥斯汀分校和普渡大学的研究团队在arXiv上发表了一篇论文，提出并测试了“LLM脑腐假说”（LLM Brain Rot Hypothesis）。研究显示，经垃圾数据训练后，Llama 8B模型的推理能力下降了23.6%，

自恋模型推理 llama llama推理 2025-10-27 19:16 7

推理效率狂飙60倍：DiDi-Instruct让扩散大模型16步超越千步GPT

近日，来自普渡大学、德克萨斯大学、新加坡国立大学、摩根士丹利机器学习研究、小红书 hi-lab 的研究者联合提出了一种对离散扩散大语言模型的后训练方法 ——DiscreteDiffusion DivergenceInstruct(DiDi-Instruct)。

模型推理 gpt 千步gpt 千步 2025-10-27 18:55 6

《开始推理吧3》即将收官，本季，你看过瘾了？

最近，看了一档推理类的综艺节目，名字叫做《开始推理吧》。该节目已经播了三季，每一季都给大家带来了不一样的观看体验。

推理人海战术周柯开始推理吧开始推理吧3 2025-07-05 06:15 7

一文读懂Agentic AI 与 AI Agent的核心区别

据行业调研显示，82% 的企业计划在未来三年内引入 AI 相关技术，但很多人仍混淆 Agentic AI 与 AI Agent 这两个概念。事实上，二者代表了 AI 应用的两种截然不同的路径：前者是具备战略思维的统筹者，后者是高效的执行者。厘清二者的技术边界，

推理机器人 agent aiagent agents 2025-10-27 09:57 8

当AI看懂世界，谁还懂人心？

十年前，扫码支付改变了中国人的生活。最近，一款名为“灵光”的App，或许正在改变人与信息的交互方式。它由支付宝（杭州）数字服务技术有限公司开发，最近在腾讯应用宝和vivo商店悄然上线。

模态推理文心蚂蚁支付宝 2025-10-26 22:18 8

LLM推理的真相

当今人工智能领域最大的谎言是“自我修正”证明了大型语言模型（LLM）能够推理。但事实并非如此：它只是在取平均值。

推理 llm var cot llm推理 2025-10-26 12:01 7

破解AI对不同上下⽂位置的敏感度不⼀致，新框架来了

语言模型遭遇严重的位置偏见，即模型对不同上下⽂位置的敏感度不⼀致。模型倾向于过度关注输⼊序列中的特定位置，严重制约了它们在复杂推理、⻓⽂本理解以及模型评估等关键任务上的表现。

模型推理 llm 锚定 cot 2025-10-26 12:11 9

DeepSeek新突破能否打破大模型瓶颈

这是一个非常前沿且具有高度行业关注度的话题。以下是对这一问题的详细分析，帮助你理解DeepSeek的创新背景、技术潜力以及其在突破大模型瓶颈方面的可能影响。

模型推理信息检索深度学习 deepseek 2025-10-25 22:35 7

逼近人类极限！Ring-1T横空出世，开源模型迎里程碑

蚂蚁开源团队出了个叫Ring-1T的模型，直接在2025年AIME测试里拿了93.4分，这个成绩快赶上人类顶尖选手了。

模型推理开源闭源 token 2025-10-25 11:19 8

蚂蚁开源 Ring-1T，成就推理、编程、通用智能三冠王

蚂蚁开源团队推出的 Ring-1T 模型，为这个长期存在的疑问提供了最具说服力的实证。不同于以往依赖海量数据“记忆”答案的语言模型，Ring-1T 试图让 AI 在复杂问题中真正“推理”出答案。

编程推理开源蚂蚁三冠王 2025-10-24 10:47 8

NeurIPS 2025 Spotlight | 让检索、推理真正「合体」的小而强模型，AceSearcher来了

如何让一个并不巨大的开源大模型，在面对需要多步检索与复杂逻辑整合的问题时，依然像 “冷静的研究员” 那样先拆解、再查证、后归纳，最后给出可核实的结论？

模型推理 spotlight ne acesearcher 2025-10-24 12:32 6

大模型推理学习新范式！ExGRPO框架：从盲目刷题到聪明复盘

实验结果显示，与传统的在线策略RLVR（基于可验证奖励的强化学习）方法相比，ExGRPO在不同基准上均带来了一定程度的性能提升。

模型推理范式 exgrpo exgrpo框架 2025-10-23 16:44 8

趋境&清华开源项目KTransformers让「异构」成为推理新范式

这是一个高性能异构推理框架，专注于高效利用底层GPU、CPU、内存等多样化算力，让大模型在更低算力、更灵活的硬件架构上高效运行，项目论文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybri

推理开源范式清华 ktransformers 2025-10-23 09:13 7

埃默里大学首创AceSearcher：让小体量AI模型像侦探一样精准推理

当你在网上搜索"哪部电影的导演出生更晚"这样的问题时，你期望得到的不仅仅是一个简单的答案，而是一个经过深思熟虑、有理有据的回应。然而，目前的AI搜索助手往往在处理这类需要多步推理的复杂问题时力不从心。埃默里大学的研究团队最近在2025年神经信息处理系统大会（N

模型推理 ai模型侦探 acesearcher 2025-10-23 05:52 7

英伟达失守中国区！推理需求爆发，国产GPU抢滩上市

电子发烧友网报道（文/莫婷婷）近日，上海证券交易所公告显示，沐曦集成电路（上海）股份有限公司（简称“沐曦”）将在10月24日迎来科创板上市委审议。这家成立于2020年的国产GPU新锐，估值已达210亿元。而在此前，另一家国产GPU公司摩尔线程已于9月26日率先

英伟达推理上市 gpu cuda 2025-10-22 09:33 7

《2026年国际人工智能安全报告:首次关键更新》不可忽视的AI风险

2025年10月14日,由图灵奖得主Yoshua Bengio领导的《2026年国际人工智能安全报告》发布了首次关键更新。这份由来自30个国家及联合国、欧盟、OECD等国际组织专家共同完成的报告,聚焦AI领域在短短数月间发生的重大变化,揭示了技术进步与风险管控

模型智能体人工智能推理风险 2025-10-21 22:43 8

暗黑推理番?吸血鬼侦探和贵族千金奇幻恋爱

被黑夜笼罩的穷途末路之际，琳迷失在异形者居住的迷之街道·吕根贝尔格。

奇幻推理吸血鬼侦探吸血鬼侦探 2025-10-21 22:34 8

上海交大突破：AI实现任务指令驱动场景生成

这项由上海交通大学的郝锦坤、上海人工智能实验室的梁乃富和许旭东等研究人员组成的团队在2025年9月发表的研究，首次提出了一个革命性的解决方案。该论文发表在计算机视觉顶级会议上，论文编号为arXiv:2509.22281v1，为机器人训练开辟了全新道路。

推理机器人数据集室内设计师 mesatask 2025-10-21 21:43 32